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摘 要 小 学 生 作 业 作 次 是 心理 学 领域 忽略 已 久 的 研究 重点 ， 机 器 学 习 是 数 智 时 代 新 兴 的 人 


工 智能 科学 。 笔 者 对 2,098 名 2 至 6 年 级 小 学 生 进行 问卷 调查 ， 采 用 机 器 学 习 法 ， 考 察 个 


体 认 知 、 道 德 判断 、 同 伴 行为 ， 及 性 别 、 年 级 、 成 绩 等 因素 对 小 学 生 作业 作 浆 行为 的 影 


响 。 结 果 表 明 : 集成 机 占 学 习 模 型 对 小 学 生 作 业 作 次 预测 准确 率 (AUC 均值 ) 达 80. 46%; 对 


作业 作 商 预测 效应 最 强 的 四 个 因素 依次 为 个 体 对 作业 作 次 的 接受 程度 、 观 察 到 同伴 作 浆 的 


普遍 性 和 频率 ， 及 其 自身 成 绩 
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SLE BEE Ta ES RANA A LE A 


题 。 


它 是 指 学 生 为 获得 理想 的 学 业 成 绩 或 排 


名 而 采取 的 秘密 且 有 意 破坏 学 业 诚 信 准 则 的 行为 ， 其 重要 表现 形式 之 一 为 作业 作 次 。 虽 然 


自 “ 双 减 ” 以 来 ， 我 国 小 学 生 的 课业 负担 明显 减轻 ， 但 不 可 否认 ， 较 之 国外 ，“ 作 业 ” 依 


然 是 我 国 义务 教育 阶段 小 学 生 最 主要 的 学 业 人 外 


E 务 ， 作 业 作 次 行为 在 小 学 生 中 仍 普 过 存在 。 


小 学 阶段 是 个 体 道德 意识 形成 及 道德 行为 习惯 塑造 的 关键 期 ， 这 一 阶段 学 生 做 出 的 作业 作 


浆 行 为 既 会 导致 其 学 业 成 绩 不 佳 进而 在 考试 中 作弊 ， 久 而 和 久之， 又 容易 使 其 作弊 行为 习惯 


化 。 并 且 ， 对 儿童 期 的 作 浆 行 为 若 不 重视 并 加 以 及 时 引导 和 干预 ， 很 容易 导致 个 体 在 成 人 


TRA, DATE TEI ARAL DL A hE 


在 学 术 界 ， 有 关 学 业 作 弊 的 研究 已 有 近 百 年 历史 (Hartshorne & May, 1928). AWWA 


可 以 预期 ， 相 较 于 考试 成 绩 ， 小 学 生 的 作业 质 


E 


后 表现 出 更 严重 的 问题 行为 ， 如 违法 乱 纪 或 犯罪 (Williams & Williams, 2012). H. “IUR” 


政策 在 强调 “减负 ”的 同时 ， 也 明确 了 提高 作业 质量 的 需求 ， 并 提倡 杜绝 “ 唯 成 绩 论 ”。 


等 平时 学 业 表 现在 未 来 的 学 业 评价 体系 中 


可 能 更 为 重要 。 为 此 ， 本 研究 束 作 业 作 次 行为 在 小 学 阶段 的 发 展 及 其 关键 性 影响 因素 进行 


上 有 针对 性 的 早期 干预 方法 提供 科学 依据 。 


的 实证 研究 ， 绝 大 多 数 都 来 自 国 外 ， 且 研究 对 象 几 乎 全 部 聚焦 于 大 学 生 和 中 学 生 群 体 (参见 


Anderman & Midgley, 2004; Cizek, 1999; Hrabak et al., 2004)， 极 少 有 研究 关注 小 学 生 群 体 


(Hartshorne & May, 1928)。 虽 然 ， 早 在 1928 年 ，Hartshorne 和 May 的 研究 就 已 揭示 小 学 阶 


段 儿 童 会 自发 地 做 出 学 业 作 次 行为 。 但 在 此 之 后 ， 因 西方 教育 体制 改革 导致 国外 小 学 阶段 


的 考试 和 作业 一 度 被 取消 ， 故 针对 小 学 生 作 浆 的 实证 研究 也 一 度 停滞 。 与 此 同时 ， 在 研究 


内 容 方 面 ， 国 外 学 业 作 次 的 研究 主要 集中 于 考试 作 浆 (Bong, 2008; Freire, 2014)， 针 对 作业 


作 浆 的 研究 非常 少 。 可 以 说 ， 到 目前 为 止 尚未 有 研究 专门 考察 过 小 学 生 的 作业 作 兹 行为 。 


与 国外 相 比 ， 国 内 有 关 学 业 作 次 的 实 记 


E 研 


By 


Jù 


起 步 更 晚 ， 且 研究 对 象 全 部 集中 于 大 学 生 
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借鉴 。 但 与 大 学 生 相 比 ， 小 学 生 的 道德 认 知 发 展 水 平 更 低 ， 故 针对 前 者 的 研究 结果 是 否 适 


用 于 小 学 生 群 体 尚 不 明确 。 鉴 于 此 ， 本 研究 将 立足 我 国 国情 ， 以 国内 外 现 有 实证 研究 结果 


为 基础 ， 重 点 考察 影响 当前 我 国 小 学 生 作 业 作弊 行为 的 可 能 因素 ， 并 从 中 寻找 关键 性 影响 


因素 。 本 研究 结果 旨 在 为 建构 儿童 诚信 行为 发 展 的 理论 模型 ， 以 及 道德 行为 发 展 理论 的 完 


善 和 本 土 化 提供 重要 的 科学 依据 。 


具体 说 来 ， 本 研究 将 以 2 至 6 年 级 小 学 生 为 研究 对 象 ， 采 用 大 样本 问卷 调查 法 和 机 器 


学 习 (Machine Learning, Pedregosa et al., 2011) 相 结合 的 方法 ， 考 察 小 学 生 作业 作 浆 行为 的 年 


级 发 展 趋势 ， 重 点 分 析 不 同 因素 对 作业 作 浆 的 影响 及 其 相对 重要 


机 器 学 习 是 数 智 时 代 新 兴 的 数据 分 析 方 法 ， 也 是 人 工 智 能 的 核心 方法 ， 它 依赖 于 计算 


机 算法 ， 旨 在 通过 数据 分 析 和 建 模 实现 对 人 类 行为 的 模拟 。 近 年 来 ， 不 少 心理 学 研究 者 已 


将 机 器 学 习 应 用 于 诸如 情绪 (Just et al., 2017) 和 精神 病理 学 等 方面 的 研究 (如 Bartlett et al., 


2014; Livieris et al., 2018)， 也 有 少数 研究 者 开始 将 该 方法 用 于 儿童 研究 (Bruer et al., 2019; 


Zanette et al., 2016)。 与 传统 的 统计 建 模 相 比 ， 机 器 学 习 具 有 以 下 四 个 方面 的 优势 。 


首先 ， 机 器 学 习 对 原始 数据 的 处 理 有 助 于 提高 最 终 模 型 的 外 部 效 度 。 传 统 分 析 方 法 


(如 ， 广 义 线 性 模型 GLM、 广 义 估 计 方 程 GEE， 等 等 ) 通 常 将 所 有 数据 统一 纳入 分 析 ， 往 往 


出 


导致 模型 过 度 拟 合 ， 所 获 模型 的 概 化 能 力 即 外 部 效 度 较 差 。 与 之 不 同 ， 机 器 学 习 (往往 需 叶 


y 


较 大 的 样本 量 ) 事 先 将 数据 分 为 三 个 子 集 : 训练 集 (train set). WAR (test set) 和 留 出 集 


(holdout set)。 首 先 用 训练 集 数据 来 拟 合 模 型 ， 然 后 用 测试 集 数据 来 检验 模型 。 再 对 这 两 个 


子 集 进行 重组 ， 重 新 随机 划分 为 新 的 训练 集 和 新 的 测试 集 ， 进 行 模型 拟 合 和 验证 。 这 个 过 


程 将 重复 多 次 ， 并 产生 多 个 可 预测 结果 变量 的 模型 。 最 后 ， 用 事先 预 留 的 留 出 集 数据 对 这 
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些 模型 的 预测 力 做 进一步 评 佑 ， 即 验证 这 些 模型 的 预测 力 能 否 概 化 到 新 的 数据 中 。 这 种 验 


证 实现 了 对 模型 外 部 效 度 的 评估 (Campbell, 1986). 


其 次 ， 机 器 学 习 赛 括 了 多 种 算法 ， 可 被 灵活 应 用 于 处 理 各 类 复杂 多 变 的 变量 间 关 系 。 


本 研究 将 采用 近年 来 广 受 关注 的 集成 学 习 法 (Ensemble Learning, 参见 Ykhlef & Bouchaffra, 


2017)。 该 方法 首先 通过 不 同 机 器 学 习 算法 对 同一 样本 群体 进行 训练 。 具 体 算法 包括 描述 变 


量 间 线性 关系 的 逻辑 回归 (Logistic Regression, Yarkoni & Westfall, 2017)， 描 述 变 量 间 非 线性 


关系 的 多 层 感知 机 (Multilayer Perceptron, MLP)、 极 端 梯度 提升 (eXtreme Gradient Boosting， 


久 GBoost) 和 随机 森林 (Random Forest) 等 (参见 , Golino et al., 2014)。 随 后 ， 将 所 有 算法 的 训练 


结果 整合 起 来 。 集 成 法 的 优势 在 于 能 够 集 各 种 算法 之 长 ， 最 大 程度 上 对 预测 变量 和 结果 变 


量 的 关系 进行 解释 ， 从 而 使 最 终 模 型 的 预测 效果 达到 最 佳 。 


第 三 ， 机 器 学 习 可 通过 Shapley 值 ， 量 化 不 同 影响 因素 在 整个 模型 中 的 相对 重要 性 。 


Shapley 值 于 1953 年 由 诺 贝 尔 经 济 学 奖 获得 者 Lloyd Shapley 提出 (Shapley, 1953)， 主 要 用 


于 衡量 各 个 预测 变量 对 结果 变量 的 相对 贡献 大 小 ， 是 机 器 学 习 结 果 的 重要 参考 指标 之 一 


(Smith & Alvarez, 2021)。 该 值 越 大 ， 代 表 该 预测 因素 对 结果 变量 的 预测 力 越 强 ， 反 之 ， 则 


代表 该 因素 的 预测 力 越 弱 。 若 该 值 趋 近 于 零 时 ， 则 代表 该 因素 对 结果 变量 几乎 不 存在 有 效 


预测 力 。 


最 后 ， 机 器 学 习 能 够 将 所 有 预测 变量 对 结果 变量 的 预测 效应 进行 量化 ， 从 而 创建 一 个 


关于 结果 变量 (如 “小 学 生 作业 作 次 的 概率 ”) 的 预测 模型 。 模 型 建立 后 ， 若 六 


as 
N 
z 
S 
$ 


FEE 


相应 预测 变量 上 的 得 分 输入 模型 ， 即 可 输出 该 学 生 作 业 作 次 的 可 能 性 ( 即 作 次 的 概率 )。 依 


据 这 一 结果 ， 能 够 初步 预测 学 生 有 多 大 的 可 能 性 会 在 作业 中 作 浆 ， 以 便于 教师 或 家 长 ; 


=> 


F 


必要 的 关注 ， 并 结合 学 生 的 实际 表现 采取 针对 性 的 教育 和 干预 措施 。 


基于 上 述 机 器 学 习 的 优势 ， 本 研究 将 重点 考察 部 分 因素 ( 即 预测 因素 ) 对 小 学 生 作 业 作 
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几乎 为 空白 ， 故 本 研究 主要 参考 了 Murdock 和 Anderman(2006) 的 学 业 作 浆 动机 模型 ， 以 及 


以 往 针 对 大 中 学 生 作 业 作 次 行 为 的 研究 成 果 。 


研究 领域 影响 力 最 大 且 应 用 最 广 的 模型 之 一 。 


对 象 的 研究 成 果 ， 从 “ 作 浆 的 代价 ~“ 作 整 的 


Murdock 和 Anderman(2006) 的 学 业 作 浆 动机 模型 是 目前 为 止 在 作 浆 ( 尤 3 


H eZ WATE BE) 
该 模型 整合 了 一 系列 以 大 中 学 生 为 主要 研究 


目的 ”及 “ 作 浆 前 对 自我 和 结果 的 认 知 (我 能 


做 到 吗 )” 三 个 方面 对 学 业 作 次 动机 进行 了 划分 。 其 中 ,“ 作 次 的 代价 ”主要 包括 作 疾 后 被 


抓 的 后 果 、 个 体 道德 水 平 、 同 伴 作 次 的 后 果 、 关 于 诚信 的 规章 


括 同 伴 压 力 、 智 力 、 课 堂 氛围 等 因素 ;“ 作 次 前 对 自我 和 结果 的 认 知 ” 则 主要 为 自 


及 个 体 对 结果 的 预期 (Murdock & Anderman, 2006)。 


依据 上 述 学 业 作 次 动机 模型 ， 在 综合 考虑 了 研究 成 果 未 来 在 小 学 中 的 可 实践 性 和 可 推 


制度 等 等 ;“ 作 次 的 目的 ” 包 


我 效能 、 


广 性 ， 同 时 参考 了 以 往 有 关 大 中 学 生 学 业 作 浆 的 实证 研究 结果 ， 本 研究 对 可 能 影响 小 学 生 


作业 作 浆 行为 的 因素 ( 即 小 学 生 作业 作 浆 的 预测 


因素 ) 进 行 了 筛选 ， 重 点 包括 以 下 几 方 面 。 


第 一 ， 作 次 后 果 的 严重 性 。 一 方面 ， 在 Murdock 和 Anderman (2006) 的 学 业 作 次 动机 模 


型 中 ， 作 次 的 后 果 被 看 作 是 学 业 作 浆 的 主要 动机 之 一 。 随 后 更 多 的 实证 研究 也 表明 ， 作 次 


的 后 果 严 重 性 对 大 中 学 生 学 业 作 次 行为 存在 影响 (Kam etal., 2017; McCabe & Treviño, 1997; 


Molnar & Kletke, 2012). 55 —77 Tf 


是 基于 实践 证 据 。 众 所 周知 , “惩罚 ”一 直 被 我 


国教 育 实 


践 工作 者 视 作 防止 作 次 发生 的 “最 有 效 /最 佳 措 施 ”。 然 而 ， 无 论 是 古 时 将 科举 舞 浆 者 量刑 


入 罪 ， 还 是 如 今 教育 主管 部 门 及 各 级 各 类 学 校外 


判定 的 针对 作 浆 的 处 罚 制 度 ( 如 取消 


考试 成 


绩 、 取 消 考试 资格 、 通 报批 评 等 )， 均 只 针对 考试 作 浆 。 相 较 于 考试 作弊 ， 目 前 少 有 学 校对 


学 生 的 作业 作 浆 行为 予以 重视 和 深究 。 这 既是 


其 频繁 性 和 参与 人 数 可 能 更 高 。 


E 是 因为 作业 作 浆 往往 被 看 成 是 一 和 


ALA TAIL VERE AI AE BAL, Me HP 


风险 极 低 且 无 不 良 后 
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果 的 违规 行为 ， 导 致 了 作业 作 次 的 普 志 性 和 频率 往往 较 高 。 因 此 ， 本 研究 假设 ， 作 次 后 果 


严重 性 程度 是 影响 小 学 生 作业 作 星 行为 的 首要 因素 。 


第 二 ， 作 次 的 可 接受 性 。Murdock 和 Anderman(2006) 的 学 业 作 次 动机 模型 认为 ,个体 


的 道德 水 平 是 影响 学 业 作 浆 的 男 一 个 重要 因素 。 以 往 针 对 大 学 生 和 中 学 生 的 实证 研究 表明 ， 


个 体 的 道德 意识 水 平 影响 其 对 作 次 可 接受 程度 的 判断 (Cheung et al., 2016; Lee et al., 2020), 


以 及 他 人 对 作 次 接受 程度 的 判断 (Ives & Giukin, 2020)。 错 误 的 判断 很 可 能 导致 个 体 美化 或 


弱化 学 业 作 商 行为 。 故 本 研究 假设 ,个 体 自 


WUE BEAT A AY) HE BE AL ZR 


FAVA Be ft, At VE Bi HG Fy Be SE PE a 


响 小 学 生 作 


第 三 ， 小 学 生 对 作业 作 次 预防 措施 的 有 效 性 评价 。Murdock 和 Anderman(2006) 的 学 业 


作 疯 动机 模型 指出 ， 学 校 与 诚信 相关 的 规章 


制度 对 作 浆 行为 具有 一 定 的 影响 。 这 一 观点 在 


之 后 的 实证 研究 中 也 得 到 了 证 实 (Ramberg & Modin, 2019)。 但 另 一 些 调查 发 现 ， 学 生 对 于 


学 校 制 定 的 学 业 诚信 政策 或 许 并 不 十 分 了 解 (Bretag et al., 2014; Gullifer & Tyson, 2014)， 这 


可 能 是 导致 学 业 作 炊 屡禁不止 的 潜在 原因 之 一 ， 即 相关 政策 并 未 发 挥 应 有 的 约束 作用 。 因 


此 ， 本 研究 假设 ， 学 生 对 作 次 预防 措施 


的 评价 ， 能 够 有 效 预测 其 作业 作 星 行为 。 


第 四 ， 同 伴 作 疾 行为 。 以 往 在 大 中 学 生 中 开展 的 实证 研究 曾 表明 ， 观 察 到 同伴 做 出 作 


浆 行 为 ， 可 能 会 导致 个 体 对 作 浆 这 


行为 进 


村 合理 化 (Jurdi et al., 2011; McCabe & Abdallah, 


2008)， 进 而 影响 其 自身 参与 作业 作 浆 行为 的 概率 (Hrabak et al., 2004)。 而 男 一 方面 ， 观 察 到 


同伴 参与 作 浆 行为 ， 也 可 能 使 观察 者 产生 “不 公平 感 ” 进而 更 倾向 于 作 炊 。 政 本 研究 假设 ， 


同伴 作 浆 行为 能 够 有 效 预测 小 学 生 的 作业 作 浆 行为 。 


除了 上 述 预 测 变量 外 ， 本 研究 还 考察 了 包括 年 龄 、 性 别 、 


以 及 


自我 报告 的 


自身 学 业 成 


绩 水 平等 一 系列 人 口 统计 学 或 个 人 缘 景 变量 对 小 学 生 作业 作 浆 行为 的 预测 作用 。 其 中 ， 以 


往 针对 大 中 学 生 的 研究 发 现 ， 成 绩 较 差 的 学 生 更 易 为 了 获得 好 成 绩 而 参与 学 业 作 败 行 为 


(Newstead et al., 1996; Özcan et al., 2019)， 且 自我 效能 感 低 ( 即 对 自身 能 力 认 知 较 差 的 人 ) 的 学 


生 作 次 的 可 能 性 也 越 高 (see Murdock & Anderman, 2006); 而 诸如 年 龄 、 性 别 等 人 口 统计 学 


变量 (Blachnio, 2019; Cizek, 1999; Freire, 2014; Jurdi et al., 2011) 与 个 体 的 学 业 作 次 行为 也 存在 


相关 。 故 本 研究 假设 ， 上 述 变 量 对 小 学 生 作 业 作 次 行为 存在 显著 预测 作用 。 


TS 


综 上 ， 本 研究 将 来 用 问卷 调查 法 ， 结 合 机 器 学 习 技 术 ， 考 察 (1) 作 业 作 次 对 个 体 可 能 造 


成 的 后 果 及 其 严重 性 的 感知 、(2) 个 体 自身 及 感知 到 同伴 对 作业 作 次 的 接受 程度 、(3) 对 各 


种 预防 作业 作 次 措施 的 有 效 性 评价 、(4) 感 知 到 同伴 的 作业 作 次 行为 ， 以 及 (5) 年 龄 、 性 别 等 


由 


ja 人 口 统计 学 变量 对 小 学 生 作业 作 炊 行为 的 影响 ， 在 此 基础 上 ， 构 建 机 器 学 习 模型 ， 采 用 和 集 


成 法 分 析 比 较 上 述 因 素 对 作业 作 浆 行为 的 预测 效应 。 
2 方法 


2.1 被 试 


本 研究 事先 经 过 了 杭州 师范 大 学 学 术 伦理 委员 会 的 伦理 审查 ， 并 征 得 了 学 生 所 在 学 校 


及 学 生 家 长 的 知情 同意 。 在 浙江 省 菜 地 级 市 选取 了 三 所 不 同类 型 的 小 学 ， 普通 公办 小 学 (以 


下 简称 “公办 小 学 ”)、 含 外 来 务工 人 员 较 多 的 公办 小 学 (以 下 简称 “民工 子弟 小 学 ”) 及 民办 小 


= 
= 
` 
($) 


学 各 1 所 ， 选 择 2 至 6 年 级 ， 从 每 个 年 级 中 随机 抽取 若干 班级 ， 进 行 整 班 问卷 调查 (考虑 到 


1 年 级 小 学 生 的 识字 水 平和 阅读 理解 能 力 均 十 分 有 限 , 且 其 家 庭 作业 很 少 , 故 本 次 调查 未 将 其 


纳入 ; Zhang, 2019)。 共 计 2300 名 小 学 生 参 与 了 本 次 问卷 调查 。 其 中 ，157 份 问 卷 完 成 率 不 


足 70%，45 份 问卷 结果 变量 相关 题目 未 作答 ， 了 予以 剔除 。 最 终 得 到 有 效 问卷 2098 份 。 有 效 


样本 的 平均 年 龄 为 10.04+1.40 岁 (男生 占 53%)， 全 体 学 生 均 为 汉族 ， 年 级 、 性 别 及 学 校 等 分 


布 情况 见 下 表 。 
R 1 2098 名 有 效 被 试 的 部 分 人 口 统计 学 信息 情况 

年 龄 (2) 性 别 ER Sit 

均值 ”标准 差 BK HA 民工 子弟 小 学 ”民办 小 学 (A) 


年 级 
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2 年 级 7.86 0.60 205 192 210 83 104 397 
3 年 级 8.79 0.40 209 189 200 84 114 398 
4 年 级 9.79 0.33 209 176 186 85 114 385 
5 年 级 10.74 0.33 240 211 183 131 137 451 
6 年 级 11.75 0.34 253 214 155 173 139 467 
合计 (人 ) ”2098 

2.2 研究 工具 


2.2.1 问卷 编制 与 施 测 


考虑 到 国 


程 分 为 三 个 阶段 。 


内 外 尚未 


进行 测量 ， 问 卷 在 以 往 针 对 大 中 学 生 学 业 作 次 的 相关 研究 的 基础 上 编制 而 成 。 问 卷 编 种 


第 一 阶段 是 访谈 。 基 


性 等 的 问卷 调查 结果 


» Fi 


SETTER AD EENET KKE, CASE A FS Vd 


= 


过 


于 Lim 和 See(2001) 对 大 学 生 学 业 作 次 的 现状 、 态 度 、 后 果 严 重 


制 访谈 提纲 。 访 谈 主 要 针对 学 生 和 教师 两 类 群体 开展 。 在 学 生 层 


面 ， 访 谈 内 容 主 要 涉及 当前 小 学 生 作 浆 (尤其 是 作业 作 整 ) 行为 的 现状 、 表 现形 式 及 其 对 作 


次 的 认 知 和 态度 等 ， 在 教师 层面 ， 除 上 述 内 容 外 ， 访 谈 还 涉及 学 校 、 家 庭 在 应 对 学 生 作 浆 


问题 方面 的 一 些 方 法 和 措施 ， 及 其 所 取得 的 成 效 。 来 自 上 述 三 所 小 学 中 的 39 名 学 生 (这 些 


受 访 学 生 不 再 参与 后 续 的 正式 问卷 调查 ) 和 9 名 教师 参与 访谈 。 访 谈 全 程 录音 ， 并 由 两 位 不 


知 研究 目的 的 心 型 


就 已 存在 ， 主 要 表现 为 抄 标准 答案 和 抄 同学 作业 等 ， 小 学 生 普遍 认为 的 作 歇 的 严重 后 果 主 


LE 学 硕士 生 进行 转录 和 编码 。 访 谈 结果 表明 :作业 作 泗 在 2 年 级 小 学 生 中 


tall 


要 涉及 被 老师 或 家 长 批评 ， 被 同学 嘲笑 等 ， 其 认为 能 够 减少 作 整 的 有 效 措施 主要 有 努力 学 


习 掌 握 知 识 点 、 加 大 惩罚 力度 和 告知 家 长 等 。 


第 二 


学 业 作 次 的 研究 问卷 ， 编 和 


阶段 为 小 范 


Hi 


测 。 在 访谈 的 基础 上 ， 进 一 步 参 考 Bucciol 等 人 (2017) 有 关 大 学 生 


判 本 研究 的 初 测 问卷 。 在 上 述 三 所 学 校 ， 随 机 选取 来 自 2 年 级 、4 
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H 


根据 问卷 作答 情 ; 


述 不 清 ， 难 以 理解 ， 或 有 疑问 的 条 目 及 选项 进行 了 修订 和 完善 。 邀 请 两 位 心理 测量 学 方 再 


年 级 和 5 年 级 的 共 158 名 学 生 ( 初 测 被 试 同样 不 参与 后 续 的 正式 问卷 调查 ) 进 行 小 范围 试 测 。 


Sai 


， 结 合 试 测 过 程 中 学 生 的 现场 反馈 ， 对 初 测 问 卷 进行 修订 ， 并 对 部 分 表 


的 专家 对 修改 后 的 问卷 进行 了 审定 ， 最 终 形成 本 研究 的 正式 问卷 。 


第 三 阶段 为 正式 调查 。 在 上 述 三 所 学 校 ， 从 2 至 6 年 级 的 各 个 班级 中 按 一 定 比 例 抽 取 


学 生 进行 问卷 调查 (为 保证 被 试 代表 性 ， 抽 样 时 确保 参与 调查 学 生 的 学 业 成 绩 分 布 较为 广 


泛 )。 问 卷 调查 采用 一 对 多 的 方式 ， 在 各 个 班级 内 独立 进行 。 问 卷 现场 发 放 ， 当 场 收 回 。 为 


最 大 程度 地 消除 学 生 的 顾虑 ， 问 卷 采用 匿名 的 形式 ， 且 问卷 发 放 、 填 写 和 回收 的 整个 过 程 


均 由 研究 助理 出 面 组 织 ， 班 主任 或 任课 教师 均 未 在 现场 ， 也 未 参与 整个 问卷 调查 过 程 。 


2.3 正式 问卷 构成 


正式 问卷 主要 对 两 部 分 内 容 进行 测量 。 一 是 研究 的 关键 结果 变量 一 一 作业 作 次 行为 ， 


二 是 预测 变量 ， 


即 作 业 作 兹 行为 影响 因素 ， 包 括 个 体 心 理 变 量 和 人 口 统计 学 变量 两 个 方面 。 


2.3.1 结果 变量 一 一 作业 作弊 行为 (简称 “作弊 行为 ”) 


的 行为 吗 ? ”, 


请 作答 者 就 自身 “在 平时 学 习 中 做 过 类 似 抄 别人 的 作业 / 抄 答案 /让 别人 帮忙 写作 业 等 


从 “1”( 从 不 ) 到 “5”( 非 常 多 ) 进行 5 点 利克 特 量 表 评 分 。 


笔者 在 后 续 的 数据 分 析 中 发 现 ， 全 体 样 本 对 该 问题 的 评分 呈 明 显 的 正 偏 态 ( 即 评 分 为 


“1” 的 学 生 比 例 很 高 ， 评 分 为 “2” 一 “5” 的 学 生 比 例 相 当 且 均 较 低 ) ， 无 法 按照 近似 正 


态 分 布 处 理 。 为 避免 统计 偏差 ， 遂 将 结果 变量 重新 编码 为 二 分 变量 ， 其 中 将 评分 为 “1” 者 


编码 为 “无 作 浆 行为 者 ”以 0 计 ; 将 评分 为 “2”~~“5” 者 编码 为 “有 过 作 浆 行为 者 ”， 


以 1 计 。 


2.3.2 预测 变量 (影响 因素 ) 的 测量 
(1 对 作业 作弊 行为 可 能 导致 后 果 的 严重 性 评价 (简称 “后 果 严 重 性 ”) 


5 FYE MLE MEAT (Cronbach's a 系数 为 0.787) 可 能 导致 的 后 果 
FE” 等 )， 请 作答 者 就 每 一 后 果 的 严重 性 程度 ， 从 “1”( 一 点 也 不 严重 ) 到 “5” 


根据 访谈 结果 ， 列 举 


(如 “老师 批 计 


行 5 点 利克 特 量 表 评分 。 


(非常 严重 ) 进 


(2) 对 作业 作 闲 行为 的 可 接受 性 (简称 “可 接受 性 ”) 
ERE (TAK “ ARZE” ); 


FAT EL EAT AB ET 8 52 7 


包括 两 个 条 目 : a 小 学 生 自 


O 


EEGI “ le FE ATES PE” )o WEREMA “1” (5E 


ERY EL PE BEAT AWAY BY BESS AS 


b. 感 知 到 同人 
全 不 能 接受 ) 到 “5”( 完 全 能 接受 ) 进 行 5 点 利克 特 量 表 订 


分 。 


(3) 对 能 够 减少 作业 作弊 行为 策略 的 有 效 性 评价 (简称 “策略 有 效 性 ”) 


根据 访谈 结果 ， 列 举 了 和 旨 在 减少 作业 作 浆 行为 的 9 种 (Cronbach's a 系数 为 0.781， 
加 仔细 ， 从 而 找 出 那些 作 浆 的 同学 ” 


bait (Ek 


的 策略 (如 “ 老 好 


等 )， 请 作答 者 就 每 一 策略 的 有 效 性 ， 从 “1”( 一 点 儿 也 没有 用 ) 到 “5”( 非 


较 高 的 内 部 一 致 性 ) 比 较 常 月 


常 有 用 ) 进 行 5 点 


T 


利克 特 量 表 评分 。 

(4 观察 到 的 同伴 的 作业 作 况 行 为 (简称 “同伴 作弊 行为 ”) 
采用 三 个 条 目 进行 测量 ，a. PEET ANEI “IEEE” )， 
做 过 ) 到 “5” 


请 作答 者 就 作业 作 浆 行为 在 周围 同学 中 的 普遍 性 进行 “1”( 从 未 见 有 人 这 档 


RIED. 


(几乎 所 有 人 都 会 做 ) 的 5 AARET 
b. 同伴 作业 作 浆 行为 的 总 体 频率 (简称 “局 储 矿 北 - 巧 低频 训 ”)， 请 作答 者 就 周围 同学 


作业 作 次 行为 的 频率 进行 “1”( 从 未 ) 到 “5”( 经 常 ) 的 5 点 利克 特 量 表 评 分 


做 
FE 所 采取 的 不 同形 式 的 作业 作 次 行为 的 频率 (简称 “同伴 作 赂 -有 体 频 康 ”)， 列 举 


c. EA 


hE IL (eB MI RAKE RC HE MLE PS SR i AEA EA 


了 访谈 中 提 及 率 较 高 的 三 利 
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帮忙 写作 业 )， 请 作答 者 就 周围 同学 做 出 每 一 种 具体 作弊 行为 的 频率 ， 进 行 “1”( 从 未 ) 到 


“5”( 经 常 ) 的 5 点 利克 特 量 表 评分 。 


(5) 人 口 学 信息 


6 年 级 )、 是 否 为 独生子 女 以 及 有 关 学 习 成 绩 的 自我 记 


均 水 平 )。 


2.4 机 器 学 习 模型 建构 


采用 SPSS 24.0 软件 分 析 数 据 。 首 先进 行 描 述 虱 


具体 包括 : 学 校 类 型 (公办 小 学 、 民 工 子 弟 小 学 及 民办 小 学 )、 年 龄 、 性 别 、 年 级 (2 至 


进行 统计 建 模 分 析 。 考 碟 到 机 器 学 习 算法 的 多 样 ! 


知性 ， 本 研究 采用 集成 学 习 法 ， 首 先 通 过 四 种 不 同 算法 对 


性 ， 


F 价 (自身 成 绩 高 于 、 等 于 或 低 于 班级 平 


统计 分 析 ， 在 此 基础 上 运用 机 器 学 习 


以 及 预测 变量 和 结果 变量 间 关 系 的 未 


进行 拟 合 ， 然 后 基于 Stacking 法 将 四 种 不 同 算法 的 训练 结果 进 


小 学 生 作业 作 浆 行为 的 预测 模型 


行 整合 。 这 四 种 算法 具体 为 : 


逻辑 回归 、 多 层 感 知 机 (MLP)、 极 端 梯度 提升 (XGBoost) 和 随机 森林 。 


2.4.1 四 种 机 器 学 习 算 法 及 步骤 


逻辑 回归 是 一 种 广义 线性 回归 ， 是 用 逻辑 函数 解决 对 分 类 变量 (以 二 分 变量 居多 ) 进 行 


预测 的 问题 。 多 层 感 知 机 (MLP) 是 一 种 前 馈 人 工 神经 网 络 模型 ， 它 由 输入 层 、 输 出 层 和 一 


个 以 上 的 隐藏 层 组 成 ， 每 一 层 均 有 若干 神经 元 ， 通 过 逐步 调整 神经 元 间 不 同 连接 的 权重 来 


拟 合 模型 。 极 端 梯度 提升 XGBoosb 是 集成 学 习 方 法 中 常用 的 策略 ， 


通过 不 断 训练 及 优化 决 


策 树 ， 并 将 每 次 训练 所 得 的 输出 值 相 加 ， 以 获得 最 终 预 测 值 。 随 机 森林 算法 与 XGBoost A 


有 一 定 的 相似 性 ， 但 两 者 最 大 的 区 别 在 于 随机 森林 的 输出 值 仅 仅 是 简单 多 数 投票 的 结果 ， 


对 不 同 决策 树 的 训练 结果 也 没有 做 进一步 的 优化 提升 。 


本 研究 在 MLP 中 构建 的 网 络 由 隐藏 层 和 双 


将 协 变量 进行 标准 化 处 理 ， 训 练 过 程 中 则 采用 共 旬 


] 


FE 切 激活 函数 引 


成 。 在 训练 开始 前 首先 


EE 梯度 下 降 法 (Conjugate Gradient Descent, 入 
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= 0.0000005, o = 0.00005, 区 间 中 心 


连续 训练 过 程 中 的 预测 误差 (针对 划分 至 训练 集 的 样本 ) 最 小 化 的 目的 。 


训练 结束 时 计算 测试 集中 的 预测 误差 ， 


集 数 据 的 过 度 拟 合 所 致 。XGBoost 是 将 训练 过 程 中 的 所 有 模型 


于 树 模 型 (gbtree) 的 方法 进行 决策 树 递 


用 于 防止 训练 集 数据 的 过 度 拟 合 。 此 


化 处 理 。 


速率 , boosting learning rate) 默 认 值 为 0. 


0, 区 间 偏 移 +0.5) 来 调整 神经 元 间 连 接 的 权重 ， 


以 确保 每 次 训练 后 预测 误差 的 减少 不 是 


参数 设置 为 默认 ， 


增 。 其 中 ， 决 策 树 的 递增 数量 为 100 FR, 


3， 以 其 作为 特征 缩减 技术 (shrinkage) 的 设 


以 达到 将 


该 算法 还 将 在 每 次 


由 于 对 训练 


并 采用 基 
n( 提 升学 习 


定 值 ， 同 样 


外 ， 用 于 


训练 集 和 测试 集 的 协 变量 都 需 预 


随机 森林 算法 在 训练 中 构建 决策 树 时 采用 的 是 自 展 法 (bootstrap) 抽 样 ， 


量 同样 默认 为 100 棵 ， 且 寻找 最 佳 分 割 属性 时 ， 把 需要 考虑 的 特征 数量 设置 为 


平方 根 。 上 述 两 个 参数 可 用 于 提高 预 


测试 集 的 协 变 量 也 预先 得 到 了 标准 化 处 理 。 


测 准确 性 


并 防止 模型 过 度 拟 合 。 此 外 ， 用 


述 四 种 机 器 学 习 算 法 均 包 含 以 下 五 个 步骤 。 第 一 


的 数据 集 : 训练 集 、 


20%). B— 


自 9 道 问 卷 问 题 (为 表 2 8 个 问题 及 其 选项 ， 


个 特征 是 通过 


才 对 学 校 、 年 级 、 性 


其 中 学 校 的 参照 水 平 为 普通 公办 学 校 ， 


生子 女 参 照 独生子 女 ) 而 得 到 。 


该 模型 在 测试 集中 进行 测试 ， 以 获得 


新 将 这 些 数 据 随 机 划分 为 新 的 训练 集 


模型 。 通 过 


获得 100 个 模拟 模型 ， 从 而 确保 无 


测试 集 和 留 出 集 (训练 集 占 总 被 试 量 的 64%, 


， 在 训练 集中 对 数据 进行 训练 ， 


最 终 输入 32 个 特征 ， 通 


一 ， 将 所 有 数据 随机 拆 分 


年 级 的 参照 为 二 年 级 ， 


测验 集 占 16%， 


以 及 学 生 对 学 习 成 绩 的 自我 评价 


性 别 的 参照 为 女 ， 


过 训练 获得 第 一 个 模型 。 


先进 行 标准 


决策 树 的 数 


样本 特征 的 


于 训练 集 和 


成 三 个 独立 


留 出 集 占 


训练 时 共有 32 个 特征 输入 。 其 中 22 个 特征 来 


门 ， 剩 余 10 


别 及 是 否 为 独生子 女 等 二 分 变量 转换 为 虚拟 变量 ( 哑 变 量 ， 


是 否 为 独 


其 性 能 指标 。 第 四 ， 将 训练 集 和 测试 集结 


和 测试 集 ， 


耸 样本 被 划分 到 训练 集 还 是 测试 集 ， 所 得 结 


重复 第 二 和 第 三 步 ， 再 次 训练 得 到 第 二 


TER 100 次 第 二 至 第 四 步 的 建 模 过 程 (“划分 -训练 -测验 -重组 -划分 ”)， 最 终 可 


果 均 能 保持 


一 定 程 度 的 稳定 性 。 第 五 ， 使 用 最 初 分 配 到 留 出 集 的 数据 (此 前 未 参与 过 任何 一 次 训练 或 测 
试 ) 对 模型 进行 最 终 验 证 ， 即 进行 外 部 效 度 的 检验 。 


2.4.2 机 器 学 习 结果 的 集成 


在 采用 上 述 四 种 机 器 学 习 算法 进行 分 析 的 基础 上 ， 本 研究 使 用 stacking 法 对 四 种 算法 


进行 整合 ( 即 集成 )。 有 具体 说 来 ， 首 先 设 置 逻辑 回归 、MLP、XGBoost 和 随机 森林 四 种 算法 


对 原始 数据 进行 训练 ， 然 后 将 四 种 算法 的 训练 结果 进行 整合 (stacking 法 设置 为 五 折 交 叉 验 


证 法 )， 最 后 再 对 整合 后 的 训练 结果 进行 测试 集 验证 和 留 出 集 验 证 (验证 算法 设置 为 逻辑 回 


归 )， 从 而 实现 对 四 种 算法 的 取长补短 ， 获 得 最 终 且 最 佳 模型 。 


2.4.3 机 器 学 习 模 型 的 关键 指标 


无 论 是 针对 每 一 种 机 器 学 习 算 法 ， 还 是 对 不 同 算法 结果 的 集成 ， 采 用 留 出 集 对 最 终 模 


型 进行 验证 均 可 得 到 模型 的 两 个 关键 指标 。 其 一 为 计算 机 模型 的 受 试 者 工作 特征 曲线 


(Receiver Operating Characteristic, ROC) 下 方面 积 (Area under the Curve, AUC). ROC 和 AUC 


是 常用 于 衡量 机 器 学 习性 能 的 指标 ， 表 现 了 分 类 模型 的 特征 。 其 中 ，ROC 是 通过 真 阳 率 


= 


(True Positive Rate, 正确 预测 出 的 阳性 的 数量 /所 有 阳性 的 数量 ) 和 假 阳 率 (False Positive Rate, 


将 阴性 误 判 为 阳性 的 数量 /所 有 阴性 的 数量 ) 绘 制 而 来 的 曲线 ( 见 图 1), AUC {AN ROC 曲线 


下 方 的 面积 ，AUC 武大 表明 分 类 器 的 效果 起 好 ， 它 可 以 用 于 评估 模型 的 敏感 性 ( 即 真 阳 率 ， 


本 研究 中 表现 为 能 够 准确 预测 “存在 作业 作 咀 行 为 ”这 一 情况 的 比例 ) 和 特异 性 (1- 假 阳 率 ， 


本 研究 中 表现 为 能 够 准确 预测 “不 存在 作业 作 浆 行为 ”这 一 情况 的 比例 )。 敏 感性 和 特异 性 


之 间 存 在 着 一 种 函数 关系 ， 在 不 同 敏感 性 条 件 下 ， 特 异性 会 朝 相 反 的 方向 变化 ， 而 在 ROC 


线 的 对 角 线 位 置 将 达到 两 者 的 最 优 组 合 。 在 实际 应 用 过 程 中 ， 因 具体 应 用 情境 不 同 ， 在 


ROC 曲线 上 以 多 少 的 敏感 性 和 特异 性 作为 标准 ， 需 要 根据 实际 情况 来 决定 。 
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1 计算 机 模型 的 受 试 者 工作 特征 
曲线 下 的 面积 AUC) 表 示 模 型 的 整体 性 


好 ， 反 之 则 越 差 。 


如 A, B, C ZAH 


1E 


i 


合作 时 完成 的 工作 量 


E. 
HE 


pð 


真 阳 率 


其 二 为 各 个 预测 变量 的 Shapley 值 。 


B 和 C 与 A 合作 时 所 能 完成 的 了 


EIRA B 和 C 


线 (ROC) 描 


假 阳 率 


能 ， 曲 线 距 离 恒 等 


绘 了 模型 敏感 性 ( 真 阳 率 ) 随 


着 特异 性 


1 


( 假 阳 率 ) 变 化 的 规律 。 


式 线 (虚线 对 角 线 ) 越 远 ， 代 表 模 型 的 分 类 能 力 越 


Shapley 值 常用 于 处 理 复 杂 分 配 问题 (Shapley, 1953)。 


同 完 成 一 项 工作 ， 在 为 A 分 配 奖金 时 ， 若 要 寻求 相对 公平 ， 则 需 通过 


合作 时 完成 的 了 


Shapley 值 法 获得 A 在 其 中 的 边际 页 献 。 该 方法 首先 需要 计算 : 仅 有 人 A 参与 时 能 够 完成 的 工 


LEERME B/C 单 人 能 够 完成 的 工作 量 ; B 和 C 与 A 


[ 作 量 。 然 后 计算 这 些 数 值 的 均值 ， 即 为 


终 的 边际 贡献 。Shapley 值 法 全 面 考虑 了 在 所 有 合作 或 单 人 关系 中 ，A 所 能 带 来 的 增益 ， 


对 A 的 边际 贡献 性 进行 


Shapley 值 法 ， 对 预测 变量 在 预测 模型 


Lundberg & Lee, 2017). 


则 。 其 中 ,“A、B、C” 即 为 不 同 的 预测 


小 ， 即 预测 准确 性 。 


预测 变量 


=H) Shapley 值 


通过 计算 每 一 个 预测 变量 的 Shapley 值 


了 公平 且 科 学 的 计算 


È 


E. 
E, 


LEE FS AEM DR PE FR IT BE A 


忆 为 此 ， 越 来 越 多 的 研究 者 开始 借助 


Ef 估 (Ghorbani & Zou, 2019; 


本 研究 的 机 器 学 习 中 ， 对 各 预测 变量 (影响 因素 )Shapley 值 的 计算 完全 遵循 上 述 计 算 规 


而 “工作 量 ” 为 变量 在 模型 中 的 贡献 性 大 


代表 其 


对 总 体 模 型 


2 FHM HEA 


性 的 实际 边际 贡献 。 


，Shapley 值 的 大 小 代表 这 些 预 测 变量 在 模型 中 的 相 
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对 重要 性 大 小 。 


3 结果 与 分 析 


3.1 描述 性 统计 


3.1.1 ERT» 


为 的 发 生 率 在 


图 2 显示 了 2 至 6 年 级 小 学 生 自 我 报告 参与 过 作 浆 的 人 数 百 分 比 。 由 图 可 见 ， 作 束 行 


3 年 级 时 有 了 明显 的 增长 ， 而 在 4 年 级 开始 相对 趋 于 稳定 。 以 年 级 为 预测 变 


量 (其 中 设 2 年 级 为 参考 组 )， 作 浆 行 为 为 结果 变量 ， 进 行 二 元 逻辑 回归 分 析 。 结 果 表 明 ， 不 


同年 级 小 学 生 的 作 烽 率 存 在 显著 差异 (p < 0.001)， 其 中 2 年 级 的 作 浆 率 显 著 低 于 其 他 各 年 级 


(2 ER vs 3 年 级 :p = 0.002, B = 0.51, OR = 1.67, 95% CI = 1.21-2.29; 2 年 级 vs 4/5/6 EM: ps 


< 0.001, B = 0.70, 0.57, 0.87; OR = 2.01, 1.77, 2.39, 95% CI = 1.46-2.75, 1.30-2.40, 1.77-3.22), 


H3, 4 5 6 


PU “SF 2B E BIE i 8 PN P 2 AX st (ps > 0.05). 


Ue fem 


t 


10% 


0% 


年 级 


图 2 2-6 年 级 自我 报告 存在 作 浆 行为 的 人 数 百 分 比 **p < 0.005, ***p < 0.001) 


3.1.2 作 闲 行为 的 影响 因素 
表 2 显示 了 全 体 受 试 者 在 每 个 预测 变量 上 的 得 分 均值 和 标准 差 。 由 表 可 见 ， 小 学 生 普 


普遍 认为 “ 受 老师 惩罚 ”(M = 3.65) 是 作 次 的 最 严重 后 果 ， 且 作 浆 是 不 能 被 接受 的 (M = 


2.02， 与 3 代表 “中 立 ” 相 比 ，p <0.001)。 与 此 同时 ， 他 们 也 倾向 于 认为 周围 同伴 对 作 浆 


的 接受 程度 较 


(M =2.08， 与 3 相 比 ;p<0.001)。 此 外 ， 小 学 生 普遍 认为 “加 强 课 堂 练 
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J, ERA PEARFA E” (M= 3.28) 是 减少 作 浆 的 最 有 效 策 略 ,“ 抄 他 人 的 作业 ”CQ = 


2.01) 是 同伴 作 浆 最 常 采 用 的 形式 。 
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R 2 作 兹 行为 预测 变量 的 描述 统计 结果 


Item Mean SD 


02. JIR HE, 1-5 


L 受 老 师 批评 3.05 1.22 
2. LEIGH 3.65 1.31 
3.” 受 父母 批评 3.24 1.25 
4.” 受 父母 惩罚 3.36 1.30 
5. 受 周 围 同学 的 批评 或 嘲笑 3.33 1.48 
Q3. A RPI REZ HE 1.81 1.12 
Q4. IPE FT EEZ HE 2.13 1.17 


OS. ME AACE, 1-9 


1. Rafe Ja GHB 2.89 1.45 
2. 老师 批改 作业 更 仔细 2.88 1.36 
3. 加 强 课堂 练习 ， 在 课堂 上 把 知识 弄 懂 3.28 1.50 
4. 老师 加 强 教育 ， 多 强调 作业 作弊 属于 不 良 行为 2.47 1.39 
5. 降低 作业 难度 2.12 1.39 
6. 老师 批评 或 惩罚 2.98 1.34 
7. 给 予 独立 完成 作业 的 同学 以 表扬 和 奖励 2.88 1.42 
8. 家 长 批评 或 惩罚 2.93 1.43 
9. 做 作业 时 父母 监督 2.84 1.45 
06. II PE VEH PF a FE 2.02 0.88 
Q7. IPE MEH eh DE 2.08 0.96 


Q8. fel FEF ERA KRK, 1-3 


1. 抄 他 人 的 作业 2.01 1.05 

2. 做 作业 时 抄 答案 1.91 1.04 

3. ”让 他 人 帮 写 作业 1.24 0.61 
3.2 机 器 学 习 分 析 


为 了 更 加 准确 地 计算 不 同 变量 对 小 学 生 作 业 作 次 行为 的 预测 效果 ， 研 究 仅 将 预测 变量 


相关 问题 作答 率 达 到 100% 的 被 试 数据 纳入 机 器 学 习 ， 故 最 终 进入 机 器 学 习 分 析 的 被 试 量 


为 1637。 如 方法 部 分 所 述 ， 本 研究 在 使 用 四 种 机 器 学 习 算 法 进行 分 析 的 基础 上 ， 重 点 对 四 


种 算法 所 获 结果 进行 集成 。 


3.2.1 四 种 机 器 学 习 算 法 及 集成 学 习 法 所 获 模型 的 AUC 均值 分 析 


3 显示 了 四 种 机 器 学 习 算法 所 各 自 模拟 出 的 100 个 模型 的 AUC 的 均值 ， 以 及 集成 


学 习 所 模拟 出 的 100 个 最 终 模型 的 AUC 的 均值 。 由 表 可 见 ， 这 些 AUC 均值 均 显著 高 于 随 


机 水 平 (50%, ps < 0.001)。 其 中 ， 集 成 学 习 法 的 最 终 预测 模型 的 AUC 均值 达到 了 80.46%, 


意味 着 该 模型 有 80.46% 的 概率 能 够 准确 预测 小 学 生 是 否 会 做 出 作业 作 浆 行为 。 


表 3 四 种 机 器 学 习 算法 及 集成 学 习 法 下 留 出 集 验 证 所 产生 的 100 个 模型 的 AUC(%) 均 值 和 标准 差 


95% 置信 区 间 


模型 均值 (%) 标准 差 

Lower Upper 
逻辑 回归 77.87 1.50 77.72 78.01 
XGBoost 77.82 1.69 77.63 78.02 
MLP 78.25 1.70 78.01 78.48 
随机 森林 79.47 0.95 79.28 79.66 
集成 学 习 80.46 0.80 80.30 80.62 
图 3 显示 了 四 种 不 同 算法 以 及 集成 学 习 分 别 所 得 的 100 个 模型 的 具体 AUC 值 ( 见 图 


3)。 如 图 所 示 ， 集 成 学 习 算法 下 的 模型 总 体 具 有 较 高 的 敏感 性 和 特异 性 (1- 假 阳性 率 )。 由 于 


li 


集成 学 习 法 综合 了 四 种 算法 的 优点 ， 故 后 续 的 分 析 将 重点 关注 集成 学 习 法 所 获 结果 。 将 于 


3 中 集成 学 习 法 的 AUC 均值 转换 为 Cohen's dg 值 ， 所 得 的 Cohen's d 均值 为 1.214(95% 置 信 


区 间 : 1.205-1.222)， 表 明 该 方法 所 获 的 100 个 最 终 模 型 的 平均 效应 量 很 大 (Cohen, 1988, 


Cohen’s d > 1.2 时 表示 效应 量 非常 大 )。 
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— amoch ) 一 PMO 


06 08 10 0.0 0.2 04 06 08 10 


0.0 0.2 04 . 
假 阳 率 假 阳 率 


C ROC d ROC 


一 roc 一 一 PROC IIR 


0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0. 06 08 10 


4 
假 阳 率 {PH 


ROC 


一 一 平均 ROC 曲 线 


0.0 0.2 0.4 0.6 0.8 1.0 
假 阳 率 


YE: a、b、c、d、e 分 别 为 逻辑 回归 、XGBoost、MLP、 随 机 森林 及 集成 学 习 算 法 的 AUC 值 。 


3 四 种 不 同 算法 及 集成 学 习 分 别 获得 的 100 个 模型 的 AUC 值 
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3.2.2 集成 学 习 法 所 获 最 终 模型 中 各 变量 的 Shapley 值 分 析 


在 集成 学 习 中 ， 


采用 留 出 集 对 最 终 模型 进行 检验 ， 得 到 所 有 预测 变量 的 Shapley 均 


值 ， 这 些 值 均 显 著 高 于 0 (ps < 0.05)， 即 所 有 预测 变量 缘 对 该 模型 具有 显著 的 边际 贡献 。 将 


这 些 预测 变量 按照 Shapley 值 的 大 小 进行 排列 ， 可 直观 显示 这 些 预 测 变量 在 模型 中 的 相对 


重要 性 排序 。 图 4 列举 了 对 模型 预测 准确 性 的 边际 贡献 大 于 或 等 于 1% 的 主要 预测 变量 。 


这 些 变量 间 的 相对 重要 性 依然 存在 较 大 的 差异 。 根 据 重 要 性 由 高 到 低 可 大 致 将 这 些 预测 变 


量 分 为 以 下 四 个 组 。 


自身 对 作业 作 浆 行为 的 可 接受 程度 (10. 49% 


作业 作 浆 行为 在 周围 的 同学 中 的 普遍 性 (3. 83%) 
学 习 成 绩 在 全 班 同 学 中 所 处 相对 水 平 (3. 26%) 
周围 的 同学 做 出 作业 作 油 行为 的 频率 (3. 10%) 

周围 的 同学 做 出 “ 抄 他 人 作业 ”这 类 作业 作 商 行为 的 频率 (2. 86% 


周围 的 同学 做 出 “做 作业 时 抄 答 案 ” 这 类 作业 作弊 行为 的 频率 (1. 61% 


对 “ 受 父母 惩 


对 “ 受 父母 批评 ”这 一 作弊 可 能 后 果 的 严重 性 的 评价 (1. 16% 
对 “ 受 老师 惩罚 ”这 一 作弊 可 能 后 果 的 严重 性 的 评价 (1. 14% 


加 民工 子弟 小 学 与 普通 公办 小 学 的 对 比 (1. 01% 


年 级 对 比 (6 年 级 vs 2 年 级 ) (1. 75% 
感知 到 的 同伴 对 作业 作弊 行为 的 接受 程度 (1. 69%) 


anea AaldeqS 


罚 ” 这 一 作 商 可 能 后 果 的 严重 性 的 评价 (1. 48%) 


年 级 对 比 (6 年 级 vs 2 年 级 ) (1. 03%) 


avio 


图 4 EERE EE FU ak Ve Bi AT AIS YY Shapley 值 及 其 95% 置 信 区 间 。 其 中 “QO 〇 ”表示 该 预测 变量 对 


结果 变量 


存在 负 向 预测 作用 ;其 他 预测 变量 对 结果 变量 均 存在 正 向 预测 作用 。 


第 一 组 为 小 学 生 自身 对 作 次 的 接受 性 (接受 性 越 高 ， 就 越 有 可 能 作 浆 )。 该 预测 变量 的 


tel 


Shapley 值 高 达 10.49%， 代 表 其 对 总 体 模 型 预测 准确 性 的 实际 边际 贡献 为 10.49%。 配 对 样 


本 1 检验 结果 显示 ， 


值 , t= 23.88, df= 327, p < 0.001)， 表 明 其 在 模型 中 的 预测 力 最 佳 且 远 高 于 其 他 变量 。 


该 变量 的 Shapley 值 显 著 高 于 3.83%( 排 序 第 二 的 预测 变量 对 应 Shapley 
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Shapley {A.A 3.83%, 


df = 327, p = 0.048). 


伴 作 次 行为 的 普 
频率 。 这 三 个 变量 的 Shapley 值 间 不 存在 显著 的 差异 (具体 数值 参 
dfs = 327, p = 0.57, 0.22, 0.08)， 且 后 两 者 i 


AUF AE PEL ET AS POU A 


预测 作用 ， 


繁 ， 个 体 


的 Shapley 值 (1.75%) 显 著 低 于 
(6 和 4 年 级 学 生 的 作 浆 率 高 于 2 年 级 学 生 )， 感 知 到 的 同伴 对 作 浆 


出 “做 作业 时 抄 答案 ”这 一 


ie THE 


XFER A FL HE A FA 


其 次 是 小 学 生 


E KH RY 


H ARA ay REMENE. 


大 )， 小 学 生 对 “ 受 


果 的 严重 性 


父母 惩罚 入 “ 受 父母 批评 ”和 “ 受 


自身 成 


同伴 作 浆 的 频率 ， 


评价 ( 越 是 认为 这 些 后 果 严 重 ， 越 不 可 能 作弊 


具体 说 来 ， 上 述 


以 及 同伴 做 出 “ 抄 他 人 作业 ” 


\S 


DA Be FRERE TT BB SEBS HIE I 8 ERP ZA TP ERD) 


除了 上 述 预 测 变量 


重要 性 非常 弱 (Shapley 值 < 0.01). 


减少 作 浆 的 策略 的 有 效 性 评价 ， 


“ 受 周围 同学 的 批 


， 剩 余 的 变量 


这 些 预测 力 非 常 弱 的 变量 主要 包括 : 


对 部 分 作 浆 可 能 带 来 后 果 的 严重 性 


第 二 组 变量 的 Shapley 值 均 在 2%-4% 内 。 首 先是 同伴 作 浆 的 普遍 性 ， 该 预测 变量 的 


的 贡献 性 显著 高 于 剩余 所 有 变量 (vs 3.26%, t= 1.98, 


绩 在 全 班 同学 中 所 处 的 相对 水 平 ( 反 向 计 分 )、 同 


这 一 特定 作弊 行为 的 


见 图 4, t= 0.57, 1.78, 1.23, 


目 有 显著 的 相关 关系 (r = 0.21, p< 0.001)， 即 三 者 


变量 均 对 作 浆 行为 存在 显著 的 正 向 


F 价 的 成 绩 越 差 也 越 有 可 能 作 浆 ， 同 伴 作 次 行为 发 生得 越 普遍 或 越 频 


第 三 组 变量 的 Shapley 值 均 在 1%-2% 内 ， 在 模型 中 的 边际 贡献 较 小 ， 该 组 变量 中 最 大 
2.9%(t =— 6.99, df= 327,p < 0.001)。 包 括 : 小 学 生 所 处 年 级 


行为 的 接受 程度 ， 同 伴 做 


作 浆 行 为 的 频率 (感知 到 的 可 接受 性 /频率 越 高 ， 作 浆 的 可 能 性 越 
老师 惩罚 ”这 三 种 作 浆 可 能 带 来 的 后 


; r = 0.44, 0.34, 0.36, ps < 0.001), 


量 虽 对 模型 预测 准确 性 具有 显著 的 贡献 (ps < 0.05), 18 


小 学 生 对 所 有 9 项 


或 大 笑 ”)， 以 及 人 口 学 信息 ( 见 表 4)。 


评价 (“ 受 老师 批评 ”和 
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chinaXiv 


K 4 VRE SE (EL ET AT A) Shapley 值 的 均值 (%) 和 标准 差 及 其 95% 置 信 区 间 


95% 置信 区 间 

预测 变量 均值 标准 差 a 
(4) Lower Upper 
民办 小 学 与 普通 公办 小 学 的 对 比 cc 


对 “ 受 周 围 同学 的 批评 或 咖 笑 ”这 一 作 浆 可 能 后 果 的 严重 性 的 评价 


年 级 对 比 (3 年 级 vs 2 年 级 ) 


的 有 效 性 评价 


的 策略 的 有 效 性 评价 


年 级 对 比 (5 年 级 vs 2 年 级 ) 


效 性 评价 


生 别 对 比 (女生 vs 男生 ) 
有 弟弟 /妹妹 者 与 独生子 女 的 对 比 


了 哥哥 /姐姐 者 与 独生子 女 的 对 比 


周围 同学 让 他 人 帮 写 作业 这 一 行为 的 频繁 性 


既 有 哥哥 /姐姐 又 有 弟弟 /妹妹 者 与 独生子 女 的 对 比 


对 “ 受 老师 批评 ”这 一 作 允 可 能 后 果 的 严重 性 的 评价 


J 


Hah AEAT SE BHR E” ae yR EE EA A A PE 


K DVE EE 9 AETI JIE” X yR ME Bk FS EA A A EH 
对 “老师 批评 或 惩罚 ”这 一 减少 作弊 的 策略 的 有 效 性 评 


对 “家 长 批评 或 惩罚 ”这 一 减少 作 歇 的 策略 的 有 效 性 订 


对 “降低 作业 难度 ”这 一 减少 作 浆 的 策略 的 有 效 性 评价 


对 “给 予 独立 完成 作业 的 同学 以 表扬 和 奖励 ”这 一 减少 作 浆 的 策略 


| 
NI 


评价 


对 “老师 加 强 教育 ， 多 强调 作业 作 浆 属于 不 恨 行 为 ”这 一 减少 作 浆 


对 “老师 批改 作业 更 仔细 ”这 一 减少 作弊 的 策略 的 有 效 性 评价 


> 


$ 
NI 
S 


X TGR SES A], ERK EFA FETE” RD NE I BD RERE 


Et 


4 讨论 


本 研究 采用 问卷 调查 及 机 器 学 习 这 一 人 了 


智 


能 的 核心 方法 ， 首 次 系统 考察 了 小 学 生 的 


作业 作 次 行为， 及 其 与 个 体 认 知 和 情境 变量 (对 作 浆 后果 的 严重 性 的 感知 、 自 身 对 作 次 的 接 
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SE AU ak 0 EU FST] PERT EBS MI ERS M 


性 和 频率 ， 以 及 性 别 


率 随 年 级 的 增长 呈现 


第 一 ， 总 体 而 言 ， 


L 
u 


Es XHENET TOUR FI CH 


7) 33% 的 小 学 生 自 我 报告 曾经 有 过 作业 作 浆 行为 ， 且 这 一 作 次 发 生 


EVE OTS). TRIPE AE Bi FS ER 


、 年 级 及 学 校 类 型 等 人 口 学 变量 之 间 的 关系 ， 得 到 以 下 结 


一 定 的 变化 趋势 。 上 有 具体 表现 为 : 2 年 级 为 小 学 生 作业 作 浆 的 萌发 阶 


Ris 3 年 级 为 激增 阶段 ， 随 后 进入 平缓 期 ， 到 6 年 级 时 ， 小 学 生 作业 作 浆 率 已 达 40.5%。 这 


RH, IERE 2 年 级 小 学 4 


次 率 迅速 增 长 的 原因 


可 能 在 于 3 年 级 的 作业 量 及 作业 频率 


中 就 已 经 出 现 ， 到 6 年 级 已 


RAY - 


导致 3 年 级 作业 作 


的 增加 。 而 4 年 级 及 以 后 表现 出 


的 作 浆 率 趋 于 平缓 ， 这 表明 了 道德 发 展 水 平 在 小 学 阶段 并 非 影响 其 作弊 行为 的 关键 因素 (该 


假设 在 小 学 生 说 谎 行 为 的 研究 中 得 到 了 训 


ESK, JL Lee, 2013)。 由 此 可 见 ， 作 次 作为 一 种 习 


惯性 行为 ， 一 旦 形成 ， 若 不 及 时 采取 有 效 的 干预 手段 ， 将 可 能 持续 存在 甚至 呈 增 长 趋势 ， 


这 从 侧面 也 反映 出 早 


期 诚信 教育 和 对 作 浆 进 


行 早期 干预 的 重要 性 。 


第 二 ， 本 研究 所 考察 的 各 个 预测 变量 均 对 小 学 生 作业 


机 器 学 习 结 果 表明 ， 通 过 集成 学 习 法 对 不 同 算法 所 获 模 型 进行 整合 ， 


作 浆 行为 时 具 


有 80.46% 的 可 能 性 能 


所 得 的 Cohen’s d 也 显示 ， 模 型 在 通过 这 些 预 测 变 量 对 小 学 生 


得 结果 的 效应 量 很 大 (Cohen’s d > 1.2). 


Ae 一 


> 


终 模型 的 较 高 预测 准确 率 和 良好 拟 合 作出 了 


比较 明显 的 差异 。 


具体 说 来 : 


KTA 


了 较 高 的 敏感 性 和 特异 性 (AUC 均值 


a 


高 达 80.46%)。 这 一 结果 意味 着 : 该 模型 


够 基于 这 些 预测 变量 对 小 学 生 是 否 作 浆 作 上 


作业 作 


机 器 学 习 模 型 各 变量 的 Shapley 值 分 析 结 果 进 


步 表 明 ， 


正确 预测 。 转 化 AUC 值 


次 行为 进行 预测 时 ， 所 


作 浆 行 为 具有 显著 的 预测 效果 。 


最 终 模 型 在 预测 作业 


所 有 预测 变量 均 对 最 


著 贡 献 。 然 而 ， 这 些 预 测 变量 的 重要 性 存在 


首先 ， 小 学 生 自身 对 作业 作 浆 行为 的 接受 程度 是 其 是 否 作 次 的 最 关键 的 预测 变量 。 他 


fj 


— 


EVA PELE i ce BESSA, WRA AT 


ob 
He 


报 


AE 


I 


万 


这 样 的 行为 。 这 一 结果 与 
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以 往 在 大 中 学 生 群 体 中 的 发 现 基本 一 致 (Abaraogu et la., 2016; Ives & Giukin, 2020). 


Murdock 和 Anderman 通过 对 以 往 研究 进行 综述 后 提出 ， 个 体 对 作 次 行为 可 接受 性 的 判断 


差异 可 能 基于 两 种 原因 : 第 一 ， 个 体 认为 作 浆 的 可 接受 性 高 可 能 是 由 于 其 并 不 认为 作 浆 是 


不 道德 的 行为 ， 第 二 ， 个 体 虽 然 知 道 作 次 是 不 道德 的 行为 ， 但 出 于 为 自己 辩护 ， 故 对 其 自 


身 作 浆 行 为 进行 了 合理 化 ， 以 此 减少 作 浆 行为 与 自身 道德 认 知 的 冲突 (Murdock & 


Anderman, 2006)。 由 此 可 见 ， 与 大 中 学 生 一 样 ， 小 学 生 对 作 浆 行为 可 接受 性 的 判断 可 能 也 


受到 了 这 两 个 原因 的 影响 。 


其 次 ， 同 伴 做 出 作业 作 浆 行为 的 普 裔 性 和 频率 也 是 个 体 是 否 作 次 的 


| 四 


要 预测 变量 ， 即 


同伴 作业 作 次 行为 是 影响 小 学 生 自 身 作业 作 浆 行为 的 重要 因素 。 该 结果 与 以 往 针对 大 学 生 


和 中 学 生 群 体 的 研究 所 获 结果 较为 一 致 ， 即 同伴 作 浆 行为 能 够 导致 个 体 对 其 自身 作 次 行为 


进行 合理 化 (Hrabak et al., 2004; Ghanem & Mozahem, 2019; McCabe & Treviño, 1993)。 近 期 


一 项 针对 来 自 世 界 多 国 研究 的 元 分 析 也 显示 ， 同 伴 作 次 是 个 体 学 业 作 浆 行为 的 最 重要 因素 


之 一 ， 且 这 种 “跟风 效应 ”受到 文化 因素 的 调节 一 一 其 在 集体 主义 文化 背景 下 较 个 体 主 义 


文化 背景 表现 更 为 明显 (Zhao & Mao et al., 2022). 


同时 ， 对 学 业 成 绩 的 自我 评价 这 一 预测 变量 也 具有 与 同伴 作 疾 行为 相似 的 重要 性 。 具 


体 表 现 为 ， 自 我 评价 成 绩 较 差 的 小 学 生 更 有 可 能 报告 自己 有 过 作业 作 浆 行为 。 这 一 结果 也 


与 针对 大 中 学 生 的 研究 所 获 结果 基本 相同 (Newstead et al., 1996; Ozcan et al., 2019)， 其 反映 


出 作 兹 行为 背后 的 一 种 潜在 动机 : 成 绩 较 差 的 学 生 希 望 通过 作 次 来 避免 失败 (参见 Oran et 


al., 2016)。 此 外 ， 还 有 研究 发 现 ， 成 绩 好 的 学 生 更 容易 受到 “学 习 、 掌 握 新 知识 ”这 一 学 


习 动 机 的 驱动 ， 成 绩 较 差 的 学 生 却 更 容易 受到 “获得 较 高 的 成 绩 ” 的 驱动 ， 为 了 考 得 更 好 


而 做 出 作 次 行为 (Putarek & Pavlin—Bernardic, 2020)。 还 有 一 种 可 能 性 是 ， 自 我 评价 学 业 成 绩 


较 兰 的 学 生 的 自我 效能 感 可 能 相对 较 弱 ， 而 自我 效能 感 弱 的 学 生 往往 更 容易 做 出 学 业 作 浆 
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行为 (see Murdock & Anderman, 2006). 


LES, S242 PELE RTR 


对 作 浆 的 接受 必 


现 ， 来 自 普 通 公办 小 学 的 学 生 相 较 于 民 了 


Modin, 2019; McCabe et al., 2012), 这些 


再 如 ， 本 研究 发 现 ， 感 知 到 的 同人 


较 弱 的 预测 作 


到 同伴 的 作 整 行为 的 普遍 性 或 频繁 性 


观察 到 的 外 部 行为 上 ， 即 小 学 生 通 过 观察 同伴 是 否 作 浆 ， 达 到 对 自身 行为 进 


用 。 并 且 ， 


[子弟 小 学 的 学 生 ， 表 现 H 


导致 这 种 学 校 间 差 异 的 原因 可 能 与 校园 风气 、 教 学 政策 以 及 好 


一 定 预 测 作用 的 因素 还 包括 年 级 ， 学 校 类 型 ， 同 伴 
和 作 浆 后 果 的 严重 性 ， 但 这 些 变量 的 预测 效应 相对 较 弱 。 例 如 ， 本 研究 发 
了 更 高 的 作业 作 浆 率 。 
i 生 关 系 等 有 关 (Ramberg & 


因素 往往 决定 了 一 所 学 校 所 特有 的 学 习 氛 围 。 


对 作 浆 行为 的 接受 程度 对 小 学 生 作业 作 浆 行为 具有 


该 变量 的 预测 力 明 显 弱 于 小 学 生 自身 对 作 浆 的 可 接受 性 ， 及 观察 


E。 由 此 可 见 ， 同 伴 行 为 对 作 次 的 影响 主要 表现 在 其 被 


行 合理 化 的 目 


的 (Jurdi et al., 2011; McCabe & Abdallah, 2008)。 然 而 ， 他 人 的 道德 意识 水 平 并 非 是 影响 小 


学 生 是 否 作 次 的 主要 因素 。 研 究 发现 “ 受 周 


作 浆 的 预测 作 


对 作 浆 后 果 的 严重 性 感知 也 是 较为 次 要 的 预测 


用 也 非常 小 ， 


该 结果 在 一 定 程 度 上 佐证 


作 浆 行为 的 预测 页 献 性 较 小 。 这 


不 存在 实质 性 的 作业 作 浆 “惩罚 ”4 


认 知 主要 来 源 于 对 考试 作 浆 可 能 导致 后 


是 ， 尽 管 各 级 各 类 学 校 大 多 制定 了 严格 的 考试 作 次 “ 


试 作 次 行为 。 这 也 表明 ， 过 度 依赖 于 外 部 强 f 


学 生 道德 价值 观 的 培养 ) 的 作 潍 德 昼 方法 是 无 法 真 J 


最 后 ， 


的 预测 因素 (但 其 对 模型 预测 的 重要 1 


小 学 


— 


gece! 


了 上 述 结 论 。 


因素 ， 即 作 次 后 果 严 重 怕 


一 结果 与 本 研究 假设 相悖 。 究 其 原因 ， 


判 度 。 小 学 生 对 作业 作 浆 后 果 的 认 知 非常 有 


4 SG y 
RET” fi 


P; 


HAEA T E 


FERNAN 


或 嘲笑 ”这 一 作弊 后 果 严 重 性 对 


对 小 学 生 作业 


可 能 是 因为 我 国 并 


限 ， 有 限 的 


果 的 认识 (如 被 父母 、 老 师 惩罚 等 )。 但 值得 反思 的 


Bl EE A) BAR o 


对 减少 作 整 策略 有 效 性 的 评价 及 其 他 部 分 人 口 统计 学 因素 是 习 


判 度 ， 却 始终 无 法 彻底 杜绝 考 


自身 能 动 性 的 培养 ( 即 对 


HEE PE Bec (IK 


生 仍 然 显 闭 高 于 0)。 其 中 ， 就 减少 作 浆 策略 的 有 效 性 而 
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言 ， 之 所 以 其 预测 作用 弱 ， 很 可 能 与 小 学 生 普 所 倾向 于 认为 这 些 币 见 的 抑制 作业 作 浆 行为 


的 集 略 效果 不 佳 、 对 其 有 效 性 打分 普 衣 偏 低 有 关 。 


本 研究 具有 一 定 的 理论 创新 性 : 作为 国内 首 个 聚焦 于 小 学 生 作业 作 浆 行为 及 其 影响 因 


素 的 研究 ， 初 步 建 立 了 关于 小 学 生 作 业 作 浆 影 响 因素 的 综合 模型 ， 并 将 这 些 影响 因素 根据 


量化 后 的 重要 性 指标 进行 了 排序 。 特 别 需 要 指出 的 是 ， 本 研究 发 现 小 学 生 作业 作 浆 的 影响 


Ce 


因素 与 大 中 学 生 学 业 作 浆 行 为 的 影响 因素 构成 并 不 完全 相同 ， 存 在 其 特殊 性 。 如 在 


Murdock 和 Anderman (2006) 的 模型 中 ， 后 果 严 重 性 是 能 够 预测 大 中 学 生 考 试 作 浆 的 至 关 重 


要 的 作 次 动机 ， 但 该 指标 对 小 学 生 作业 作 浆 的 影响 却 远 不 如 预期 之 大 。 可 见 小 学 生 群 体 具 


有 其 发 展 的 特殊 性 。 此 外 ， 本 研究 还 发 现 ， 除 了 后 果 严 重 性 ， 还 有 一 些 被 以 往 研究 证 明 能 


够 影响 大 学 生 和 中 学 生 学 业 作 浆 行为 的 因素 ， 在 预测 小 学 生 作 业 作 浆 时 贡献 也 非常 微弱 ， 


如 是 否 是 独生子 女 (Tsui & Ngo, 2016, 兄弟 姐妹 数量 越 多 的 大 学 生 越 有 可 能 作 浆 )、 性 别 


(Gallowaya, 2012, 男 高 中 生 作 次 率 高 于 女生 ) 等 ; 但 部 分 对 小 学 生 作业 作 浆 具有 较 强 预测 作 


用 的 变量 在 大 中 学 生 学 业 作 次 行为 中 却 不 存在 显著 效应 ， 如 年 级 (Ives et al., 2017) 等 。 


但 是 ， 研 究 结果 也 表明 ， Murdock 和 Anderman (2006) 提 出 的 一 些 影 响 大 中 学 生 作 次 


行为 的 关键 要 素 也 能 够 预测 小 学 生 的 作业 作 效 ， 即 也 存在 一 定 的 相似 性 。 如 个 体 自 身 对 作 


业 作 次 行为 的 可 接受 性 ， 同 伴 作 业 作 次 的 普遍 性 和 发 生 频 率 ， 及 其 自身 的 成 绩 水 平 是 预测 


小 学 生 作 业 作 次 的 关键 变量 。 可 见 ， 多 个 影响 着 大 学 生 和 中 学 生 学 业 作 次 行为 的 因素 ， 也 


同样 会 对 小 学 生 的 作业 作 浆 行为 存在 显著 影响 (Abaraogu et al., 2016; Ghanem & Mozahem, 


2019)。 


此 外 ， 本 研究 还 发 现 ， 个 体 对 情境 的 认 知 (如 “个 体 自身 对 作业 作 浆 行为 的 可 接受 


性 ”等 ) 在 影响 作业 作 浆 行为 中 也 发 挥 着 重要 的 作用 。 这 一 结果 为 一 个 长 久 以 来 的 有 关 作 星 


是 情境 驱动 还 是 个 体 特质 驱动 这 一 争议 提供 了 新 的 思路 和 理论 依据 。 过 去 关于 作 次 的 研究 
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似乎 更 加 认可 个 体 的 作 浆 行为 是 受 情境 而 非 个 人 特质 驱动 的 (Hartshorne & May, 1928). mi 


本 研究 的 结果 则 表明 ， 情 境 和 个 人 特质 的 交互 作用 


本 研究 在 方法 上 也 具有 


一 定 的 创新 性 。 近 年 来 ， 随 着 人 工 智 能 在 医学 、 


可 能 也 在 其 


! 发 挥 着 重要 的 作用 。 


化 学 及 生物 学 


等 领域 的 广泛 应 用 ， 机 器 学 习 技术 已 在 成 人 (Bartlett et al., 2014; Just et al., 2017; Livieris et 


al., 2018) 乃 至 儿童 (Bruer et al., 2019; Zanette et al., 2016) 研 究 中 得 到 越 来 越 广泛 的 应 用 。 本 


研究 首次 将 机 器 学 习 运用 于 儿童 道德 研 


完 领 域 ， 对 小 学 生 作 业 作 整 行为 的 影响 因素 进行 深 


入 分 析 。 结 果 表 明 ， 机 器 学 习 法 在 分 析 儿 童 行为 发 展 数据 上 是 可 行 的 ， 在 数 智 时 代 背 景 


下 ， 为 后 续 更 多 的 儿童 心理 学 领域 同行 提供 了 一 种 新 的 研究 和 数据 分 析 思 路 。 


本 研究 还 具有 较 强 的 实践 创新 性 。 本 研究 采用 机 器 学 习 方法 创建 了 能 够 预测 小 学 生 有 


多 大 的 概率 会 做 出 作业 作 浆 行为 的 模型 (预测 准 古 


相关 app 或 网 页 版 测试 ， 在 小 学 中 投入 应 用 。 具 体 来 说 ， 首 先 H 


AIX 80% 以 上 )， 未 来 可 基于 该 模型 创建 


日 小 学 生 在 app 或 网 页 上 填 


写本 研究 的 问卷 并 提交 ， 后 台 基 于 已 有 模型 对 提交 的 数据 进行 计算 并 输出 结果 ( 即 每 位 小 学 


AE VEL EK HITI EE BAEZ, 0% 至 100%)。 根 据 输出 的 结果 ， 教 师 


学 生 当 下 有 多 大 的 可 能 性 会 在 作业 中 作 浆 ， 


意 的 是 ， 我 们 并 不 能 依据 一 次 测试 的 结果 就 给 学 4 


果 ， 还 需 结合 研 究 伦理 和 学 校 教育 方式 加 以 综合 考虑 。 此 外 ， 由 于 


测 变量 对 预测 作业 作 整 的 贡献 性 非常 小 ， 如 对 预防 作 浆 的 方法 的 有 效 性 


可 继续 删除 问卷 中 的 相关 条 


过 
党 


长 能 够 初步 了 解 小 


以 便于 教师 或 家 长 进行 必要 的 关注 。 但 值得 注 


“贴标签 >， 关 于 如 何 使 月 


预测 模型 的 结 


目前 问卷 涉及 的 部 分 预 


评价 等 。 后 续 研 究 


目 并 重新 建 模 ， 开 发 出 


成 果 在 学 校 和 家 庭 教育 中 的 


此 外 ， 本 研究 还 为 诚信 教育 的 方式 方法 提供 了 


对 作 浆 的 可 接受 性 (或 者 说 “ 


小 学 生 的 作业 作 次 行为 。 这 就 给 予 家 长 、 老 昨 


推广 应 用 。 


更 简短 的 问卷 。 此 举 将 进 


步 推进 研究 


具体 、 可 操作 的 实践 方案 。 首 先 ， 个 体 


道德 意识 ”)， 而 非 作业 作 浆 后 果 的 严重 性 ， 能 够 较 好 地 预测 


及 广大 教育 了 


[作者 以 启示 : 不 应 一 味 强调 作 
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其 认识 到 作 次 是 “ 零 容忍 ”的 不 道德 行为 。 其 次 ， 由 于 同伴 作 浆 对 个 体 作业 作 浆 影响 很 


大 ， 因 此 教师 和 家 长 应 注意 减少 同伴 行为 所 产生 的 负面 影响 ， 并 尝试 通过 各 种 方法 树立 同 


伴 的 正面 影响 。 例 如 ， 给 予 那些 即使 作业 做 得 不 好 ， 但 仍然 选择 独立 完成 的 学 生 以 充分 肯 


定 ， 让 学 生 认识 到 ， 独 立 完 成 作业 比 正确 率 更 重要 (Misselbrook, 2014; Siev & Kliger, 


2019)。 再 次 ， 学 校 还 应 积极 响应 教育 部 倡导 的 “ 双 减 ”政策 ， 重 “ 质 ” 不 重 “ 量 ”， 并 着 


力 建立 起 一 种 良性 的 学 习 氛 围 ， 杜 绝 “ 唯 成 绩 论 ” 证 学 生 认 识 到 ， 做 作业 仅仅 是 对 课 上 知 


只 的 查 漏 补缺 和 及 时 巩固 ， 并 不 是 为 了 让 同班 同学 “一 较 高 下 ”(Misselbrook, 2014; Siev & 


< 


Kliger, 2019)。 最 后 ， 作 次 是 一 种 习惯 性 行为 (Davy et al., 2007)， 鉴 于 小 学 生 的 学 业 作 次 率 


在 所 有 年 龄 段 中 相对 较 低 (Cochran, 2015)， 尚 处 于 萌发 阶段 ， 我 们 更 应 该 “从 娃娃 抓 起 ”， 


适时 在 小 学 万 至 幼儿 园 阶段 推广 诚信 教育 ， 将 作 整 行为 “扼杀 在 摇篮 里 ”。 


本 研究 存在 一 定 的 局 限 性 。 首 先 ， 本 研究 所 创建 的 小 学 生 作 业 作 浆 行 为 的 预测 模型 达 


至 


= 


了 80.46%, {AUS FF TEI 20% 的 预测 错误 的 可 能 性 ， 因 此 仍 需 在 未 来 的 研究 中 进一步 优化 


模型 。 一 方面 ， 可 以 通过 理论 探索 ， 寻 找 更 多 新 的 可 能 影响 作业 作 浆 的 预测 变量 来 完善 模 


型 。 本 研究 主要 参考 了 影响 大 学 生 和 中 学 生 学 业 作 浆 行为 的 因素 ， 且 侧重 于 考察 与 学 校 有 


关 的 情境 因素 对 小 学 生 作 业 作 次 行为 的 影响 ， 因 此 不 能 排除 还 有 其 他 预测 因素 的 存在 。 且 


研究 结果 表明 ， 相 较 于 大 中 学 生 ， 影 响 小 学 生 作业 作 浆 的 因素 也 具有 一 定 的 特殊 性 ， 未 来 


iu 


NS 


的 研究 可 依据 上 述 领 域 进行 拓展 ， 更 充分 地 挖掘 影响 小 学 生 作 浆 的 因素 ， 进 而 创建 一 个 科 


q 


D 


学 而 完备 的 、 专 门 适 用 于 小 学 生 作 业 作弊 的 理论 模型 。 另 一 方面 ， 机 器 学 习 是 服务 于 大 数 


据 的 方法 ， 未 来 可 将 本 研究 问卷 转变 为 app 或 网 页 ， 通 过 进一步 扩大 样本 量 可 以 通过 i 


步 扩大 样本 量 ， 再 增加 一 个 外 部 验证 的 数据 集 ， 对 参数 进行 调 优 ， 进 一 步 完善 模型 ， 提 高 


模型 的 预测 准确 性 。 其 次 ， 本 研究 对 于 小 学 生 作业 作 炊 行为 的 测量 采用 的 是 自我 报告 法 ， 
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率 这 一 可 能 性 。 未 来 研究 可 尝试 通过 自我 报告 法 和 行为 实验 法 相 结 合 的 方式 来 解决 该 问 


事实 上 ， 最 近 己 有 越 来 越 多 的 研究 者 开始 采用 实验 法 来 研究 作 浆 问题 ， 但 这 些 实验 范 


i 
o 
Jin 


式 比 较 适 合 年 龄 相对 较 大 的 学 生 群 体 或 成 人 (Cizek, 1999; Zhao et al., 2021; Zhao & Peng et 


al., 2022)， 实 验 法 在 儿童 群体 中 的 适用 性 还 有 待 于 更 多 研究 加 以 检验 。 最 后 ， 本 研究 考察 


了 不 同 作业 作 浆 方式 的 普遍 性 ， 但 这 些 方式 以 “ 抄 作业 ”“ 抄 答案 ”等 传统 方式 为 主 ， 并 


未 涉及 数 智 时 代 下 一 些 新 型 的 作 炊 方式 (如 ， 采 用 “ 爱 作业 ”等 批改 作业 的 app WET EM, 


或 其 他 “ 线 上 ”方式 作弊)。 未 来 研究 可 对 上 述 新 型 作 皮 方式 加 以 探讨 。 


5 结论 


本 研究 首次 聚焦 小 学 生 作 业 作 浆 行 为 ， 采 用 机 器 学 习 集 成 算法 ， 系 统考 察 了 影响 小 学 


生 作业 作 浆 行为 的 关键 因素 及 其 相对 重要 性 。 结 果 表 明 ，33% 的 小 学 生 自 我 报告 曾经 做 过 


作业 作 整 行为 ， 且 作 整 行为 的 发 生 率 随 年 级 的 增长 呈 上 升 趋势 ， 机 器 学 习 集 成 算法 得 到 的 


预测 模型 AUC 值 达 80.46%， 能 够 较 准 确 地 预测 小 学 生 的 作业 作 次 行为。 总 的 来 说 ， 小 学 


生 的 作业 作 浆 行为 很 大 程度 上 取决 于 他 们 对 于 作业 作 次 的 接受 性 ， 同 伴 的 作业 作 次 行为 ， 


及 其 自身 的 成 绩 水 平 。 上 述 结果 为 儿童 诚信 行为 发 展 的 理论 构建 以 及 学 业 作 次 的 早期 干预 


提供 了 科学 依据 。 此 外 ， 本 研究 也 表明 ， 机 器 学 习作 为 人 工 智 能 的 核心 方法 ， 是 一 种 可 用 


于 分 析 发 展 性 数据 分 析 的 有 效 方法 。 
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Abstract 

Background. Academic cheating has been a challenging problem for educators for centuries. 
It is well established that students often cheat not only on exams but also on homework. Despites 
recent changes in educational policy and practice, homework remains one of the most important 
academic tasks for elementary school students in China. However, most of the existing studies on 
academic cheating for the last century have focused almost exclusively on college and secondary 
school students, with few on the crucial elementary school period when academic integrity begins 
to form and develop. Further, most research has focused on cheating on exams with little on 
homework cheating. The present research aimed to bridge this significant gap in the literature. We 
used the advanced artificial intelligence methods to investigate the development of homework 


cheating in elementary school children and the key contributing factors so as to provide scientific 


basis for the development of early intervention methods to promote academic integrity and reduce 


cheating. 


Method. We surveyed elementary school students from Grades 2 to 6 and obtained a valid 


sample of 2,098. The questionnaire included students’ self-reported cheating on homework (the 


dependent variable). The predictor variables included children’s ratings of (1) their perceptions of 


the severity of consequences for being caught cheating, (2) the extent to which they found 


cheating to be acceptable, and the extent to which they thought their peers considered cheating to 


be acceptable, (3) their perceptions of the effectiveness of various strategies adults use to reduce 


cheating, (4) how frequently they observed their peers engaging in cheating, and (5) several 


demographic variables. We used ensemble machine learning (an emerging artificial intelligence 


methodology) to capture the complex relations between cheating on homework and various 


predictor variables and used the Shapley importance values to identify the most important factors 


contributing children’s decisions to cheat on homework. 


Results. Overall, 33% of elementary school students reported having cheated on homework, 


and the rate of such self-reported cheating behavior increased with grade. The best models with 


the ensemble machine learning accurately predicted the students’ homework cheating with a mean 


Area Under the Curve (AUC) value of 80.46%. The Shapley importance values showed that all 


predictors significantly contributed to the high performance of our computational models. 


However, their importance values varied significantly. Children’s cheating was most strongly 


predicted by their own beliefs about the acceptability of cheatings, how commonly and frequently 


they had observed their peers engaging in academic cheating, and their achievement level. Other 


predictors such as children’s beliefs about the severity of the possible consequences of cheating 


(e.g., being punished by one’s teacher), their beliefs about the effectiveness of cheating deterrence 


strategies (e.g., working harder) and demographic characteristics, though significantly, were not 


important predictors of elementary school children’s homework cheating. 


Conclusion. This study for the first time examined elementary school students' homework 


cheating behavior. We used machine learning integration algorithms to systematically investigate 


the key factors contributing to elementary school students' homework cheating. The results 


showed that homework cheating already exists in the elementary school period and increases with 


grade. Advanced machine learning algorithms revealed that elementary school students' 


homework cheating largely depends on their acceptance of cheating, their peers' homework 


cheating, and their own academic performance level. The present findings advance our theoretical 


understanding of the early development of academic integrity and dishonesty and forms the 


scientific basis for developing early intervention programs to reduce academic cheating. In 


addition, this study also shows that machine learning, as the core method of artificial intelligence, 


is an effective method that can be used to analyze developmental data analysis. 


Keywords : elementary school students, honesty behavior, academic cheating, cheating on 


homework, machine learning, prediction, peer behavior 


